Pandas是用來創建和操作結構化資料的Python函式庫。什麼是結構化資料?簡單來說就是excel或資料庫中的表格資料。不管是資料讀取、篩選、統計匯整,甚至是在excel中有點難處理的groupby、pivot、樞紐分析表,在Pandas都可以輕鬆完成。
官方網站,了解更多 > https://pandas.pydata.org/docs/
因為客戶在用。不是。
高效運算:基於Numpy支援向量化運算,效能遠超逐列運算。
高度整合:可無縫銜接Python生態圈的資料分析與機器學習流程。
語法直覺:一行就能篩選出特定資料,與SQL思維接近,入門快。
易於重塑資料:無痛實現橫縱向堆疊/merge/join/melt,還有user最愛的轉置。
支援多種格式:CSV, Excel, JSON, SQL。
資源多:幾乎是資料分析領域的基石,爬文、發問、GPT都so ez。
有vscode的話安裝也是so ez,在vscode terminal pip install
pip install pandas
了解更多 > https://pypi.org/project/pandas/
安裝完記得先import才能使用。先來簡單粗暴的讀個csv檔,後面再詳細介紹。
import pandas as pd
csv_data = pd.read_csv('upload0.csv')
print(csv_data)
import pandas as pd 的意思是匯入pandas這個套件,並以pd為別名,所以後面我們呼叫相關的功能時,都會用pd,而不用打全名pandas,譬如範例中的pd.read_csv。pd是Pandas社群慣用的別名,也可以用其他的別名,但是強烈建議就跟著社群大大們走。
登愣!是不是很簡單,無痛讀csv!
Data Structure
Pandas 提供了兩種類型的資料結構來處理資料